Prétraitement des bases de données de réactions chimiques pour la fouille de schémas de réactions

نویسندگان

  • Frédéric Pennerath
  • Géraldine Polaillon
  • Amedeo Napoli
چکیده

Résumé. Un grand nombre de réactions chimiques sont aujourd’hui répertoriées dans des bases de données. Les chimistes aimeraient pouvoir fouiller les graphes moléculaires contenus dans ces données pour en extraire des schémas de réactions fréquents. Deux obstacles s’opposent à cela : d’une part la manière dont les chimistes représentent les réactions par des graphes ne permet pas aux techniques de fouille de graphes d’extraire les schémas de réactions fréquents. D’autre part les bases de données contiennent des descriptions de réactions souvent incomplètes, ambiguës ou erronées. Le présent article décrit un processus de prétraitement opérationnel qui permet de filtrer, compléter puis transformer le contenu d’une base de réactions en des données fiables constituées de graphes abstraits répondant au problème de la fouille de schémas de réactions. Le processus place ainsi les bases de réactions à portée des techniques de fouille de graphes comme en attestent les résultats expérimentaux.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

La fouille de graphes dans les bases de données réactionnelles au service de la synthèse en chimie organique

Résumé. La synthèse en chimie organique consiste à concevoir de nouvelles molécules à partir de réactifs et de réactions. Les experts de la synthèse s’appuient sur de très grandes bases de données de réactions qu’ils consultent à travers des procédures d’interrogation standard. Un processus de découverte de nouvelles réactions leur permettrait de mettre au point de nouveaux procédés de synthèse...

متن کامل

Prétraitement de grands ensembles de données pour la fouille visuelle

Résumé. Nous présentons une nouvelle approche pour le traitement des ensembles de données de très grande taille en fouille visuelle de données. Les limites de l’approche visuelle concernant le nombre d’individus et le nombre de dimensions sont connues de tous. Pour pouvoir traiter des ensembles de données de grande taille, une solution possible est d’effectuer un prétraitement de l’ensemble de ...

متن کامل

Prétraitement Supervisé des Variables Numériques pour la Fouille de Données Multi-Tables

Résumé. Le prétraitement des variables numériques dans le contexte de la fouille de données multi-tables diffère de celui des données classiques individuvariable. La difficulté vient principalement des relations un-à-plusieurs où les individus de la table cible sont potentiellement associés à plusieurs enregistrements dans des tables secondaires. Dans cet article, nous décrivons une méthode de ...

متن کامل

Recherche de sous-structures fréquentes pour l'intégration de schémas XML

Résumé. La recherche d’un schéma médiateur à partir d’un ensemble de schémas XML est une problématique actuelle où les résultats de recherche issus de la fouille de données arborescentes peuvent être adoptés. Dans ce contexte, plusieurs propositions ont été réalisées mais les méthodes de représentation des arborescences sont souvent trop coûteuses pour permettre un véritable passage à l’échelle...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2008